Telegram Group & Telegram Channel
Как можно визуализировать многомерные данные в 2D?

Существует несколько методов. Вот наиболее распространённые:

▪️Метод главных компонент (PCA)
Позволяет не только понизить размерность, но выявить наиболее информативные признаки в данных. Его суть заключается в предположении о линейности отношений данных и их проекции на подпространство ортогональных векторов, в которых дисперсия будет максимальной. Такие вектора называются главными компонентами и они определяют направления наибольшей изменчивости (информативности) данных. Именно эти главные компоненты можно визуализировать в 2D.

▫️Стохастическое вложение соседей с t-распределением (t-SNE)
Это техника нелинейного снижения размерности, хорошо подходящая для вложения данных высокой размерности для визуализации в пространство низкой размерности (двух- или трёхмерное). Метод моделирует каждый объект высокой размерности двух- или трёхмерной точкой таким образом, что похожие объекты моделируются близко расположенными точками, а непохожие точки моделируются точками, далеко друг от друга отстоящими.

#предобработка_данных



tg-me.com/ds_interview_lib/330
Create:
Last Update:

Как можно визуализировать многомерные данные в 2D?

Существует несколько методов. Вот наиболее распространённые:

▪️Метод главных компонент (PCA)
Позволяет не только понизить размерность, но выявить наиболее информативные признаки в данных. Его суть заключается в предположении о линейности отношений данных и их проекции на подпространство ортогональных векторов, в которых дисперсия будет максимальной. Такие вектора называются главными компонентами и они определяют направления наибольшей изменчивости (информативности) данных. Именно эти главные компоненты можно визуализировать в 2D.

▫️Стохастическое вложение соседей с t-распределением (t-SNE)
Это техника нелинейного снижения размерности, хорошо подходящая для вложения данных высокой размерности для визуализации в пространство низкой размерности (двух- или трёхмерное). Метод моделирует каждый объект высокой размерности двух- или трёхмерной точкой таким образом, что похожие объекты моделируются близко расположенными точками, а непохожие точки моделируются точками, далеко друг от друга отстоящими.

#предобработка_данных

BY Библиотека собеса по Data Science | вопросы с собеседований


Warning: Undefined variable $i in /var/www/tg-me/post.php on line 283

Share with your friend now:
tg-me.com/ds_interview_lib/330

View MORE
Open in Telegram


Библиотека собеса по Data Science | вопросы с собеседований Telegram | DID YOU KNOW?

Date: |

Telegram has exploded as a hub for cybercriminals looking to buy, sell and share stolen data and hacking tools, new research shows, as the messaging app emerges as an alternative to the dark web.An investigation by cyber intelligence group Cyberint, together with the Financial Times, found a ballooning network of hackers sharing data leaks on the popular messaging platform, sometimes in channels with tens of thousands of subscribers, lured by its ease of use and light-touch moderation.

China’s stock markets are some of the largest in the world, with total market capitalization reaching RMB 79 trillion (US$12.2 trillion) in 2020. China’s stock markets are seen as a crucial tool for driving economic growth, in particular for financing the country’s rapidly growing high-tech sectors.Although traditionally closed off to overseas investors, China’s financial markets have gradually been loosening restrictions over the past couple of decades. At the same time, reforms have sought to make it easier for Chinese companies to list on onshore stock exchanges, and new programs have been launched in attempts to lure some of China’s most coveted overseas-listed companies back to the country.

Библиотека собеса по Data Science | вопросы с собеседований from tw


Telegram Библиотека собеса по Data Science | вопросы с собеседований
FROM USA